Una metodología para la detección del perfil de un autor

نویسندگان

  • Yuridiana Alemán
  • Darnes Vilariño Ayala
  • David Pinto
چکیده

Resumen En este artículo se presenta una metodología para la detección del perfil de un autor usando los siguientes dos elementos: género y edad. Para esto se parte de un conjunto de diálogos, escritos en dos idiomas: inglés y español, proporcionado para la competencia Author Profiling dentro del foro de evaluación “Uncovering Plagiarism, Authorship, and Social Software Misuse” (PAN2013). Se utiliza conteos de características léxicas, semánticas y sintácticas para generar un sistema de clasificación de dos fases, el cual clasifica primero el género y posteriormente la edad. Los resultados obtenidos muestran que, con la cantidad de datos disponibles, es posible caracterizar tanto la edad como el género de un autor con una exactitud mayor al 50%. Sin embargo, estos valores podrían mejorarse al tener una mayor evidencia de información en los datos de entrenamiento.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Secuencias de alarmas para detección y diagnóstico de fallos

1  Resumen-En este artículo se habla de las secuencias de las alarmas de una planta industrial y cómo pueden ser utilizadas para detectar y diagnosticar fallos. Este trabajo parte del Gerenciamiento de Alarmas, un tema que busca reducir el número de alarmas desplegadas a los operadores, contribuyendo a la apropiada detección y diagnóstico de fallos. Se muestran algunas técnicas de búsqueda cuy...

متن کامل

Detección y diagnóstico de fallas en sistemas eléctricos de potencia (SEP) combinando lógica difusa, métricas y una red neuronal probabilística

Resumen. En el presente trabajo se propone un sistema para la supervisión de una red eléctrica con cambios de carga dinámicos propuesta por la IEEE. El sistema está compuesto por dos etapas. La etapa de detección utiliza un sistema de lógica difusa y la etapa de diagnóstico hace uso de las distancias Euclidianas entre líneas con el fin de generar un patrón dentro de los elementos del sistema, e...

متن کامل

Clasificación de frases obscenas o vulgares dentro de tweets

Resumen. Se propone una metodología para la detección frases obscenas y vulgares en los tweets, debido a que México es uno países donde se usa mucho el doble sentido para comunicarse. La metodología propuesta se apoya en un diccionario de mexicanismos etiquetado manualmente por expertos. Se pudo detectar que las palabras obscenas y vulgares son las que más se emplean y los estados del país que ...

متن کامل

Aplicación de Minería de Datos para la Detección de Anomalías: Un Caso de Estudio

La Minería de Datos es una de las soluciones de la Inteligencia de Negocios, que ayuda a extraer conocimiento a partir de datos que las empresas han generado producto de su negocio. Este conocimiento puede generar aplicaciones de alto valor agregado si el proceso de Minería de Datos es entendido apropiadamente desde una perspectiva del negocio. Aplicaciones tales como detección de anomalías par...

متن کامل

771-775 Pinto LAJP 1287

Papain is a proteolytic enzyme used in topical formulations for peeling and treatment of burns, wounds and scars. It is also used as progressive depilatory agent and as cutaneous absorption enhancer. This work was aimed at validating a spectrofluorimetic method to quantify the activity of papain in semisolid pharmaceutical dosage forms. Benzyloxycarbonyl-phenylalanyl-arginine 7-amido-4-methylco...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Research in Computing Science

دوره 85  شماره 

صفحات  -

تاریخ انتشار 2014